SQL Syntax এবং Query Structure

Big Data and Analytics - অ্যাপাচি ইমপালা (Apache Impala) - Impala SQL Queries এর মৌলিক ধারণা
178

Apache Impala একটি SQL-ভিত্তিক ডেটাবেস ইঞ্জিন, যা হাডুপ (Hadoop) পরিবেশে দ্রুত ডেটা বিশ্লেষণ করার জন্য ব্যবহৃত হয়। Impala SQL এর স্ট্যান্ডার্ড সিনট্যাক্স এবং কোয়েরি স্ট্রাকচার অনুসরণ করে, যা হাডুপ পরিবেশের উপর SQL-ভিত্তিক কোয়েরি চালানোর জন্য উপযোগী।


Impala SQL সিনট্যাক্স

Impala SQL সিনট্যাক্স স্ট্যান্ডার্ড SQL এর মতোই, তবে কিছু বিশেষ বৈশিষ্ট্য রয়েছে যা Impala-কে বড় ডেটা সেটে কাজ করতে সহায়ক করে তোলে। Impala SQL কোয়েরি বিভিন্ন ধরনের ডেটাবেস অপারেশন যেমন ডেটা নির্বাচন (SELECT), ইনসার্ট (INSERT), আপডেট (UPDATE), ডিলেট (DELETE), এবং ডেটাবেস ম্যানেজমেন্টের জন্য ব্যবহৃত হয়।

১. SELECT কোয়েরি

SELECT স্টেটমেন্ট দিয়ে ডেটাবেস থেকে ডেটা নির্বাচন করা হয়। এটি Impala SQL এর সবচেয়ে মৌলিক কোয়েরি।

SELECT column1, column2
FROM table_name
WHERE condition;
  • column1, column2: যে কলামগুলোর ডেটা আপনি নির্বাচন করতে চান।
  • table_name: টেবিলের নাম যেখানে থেকে ডেটা নির্বাচিত হবে।
  • condition: ফিল্টার করার জন্য শর্ত।

২. INSERT INTO কোয়েরি

INSERT INTO স্টেটমেন্ট দিয়ে টেবিলে নতুন ডেটা ইনসার্ট করা হয়।

INSERT INTO table_name (column1, column2)
VALUES (value1, value2);

৩. UPDATE কোয়েরি

UPDATE স্টেটমেন্ট ব্যবহার করে কোনো টেবিলের ডেটা পরিবর্তন করা যায়।

UPDATE table_name
SET column1 = value1, column2 = value2
WHERE condition;

৪. DELETE কোয়েরি

DELETE স্টেটমেন্ট দিয়ে টেবিল থেকে ডেটা মুছে ফেলা হয়।

DELETE FROM table_name
WHERE condition;

৫. CREATE TABLE কোয়েরি

Impala এ নতুন টেবিল তৈরি করতে CREATE TABLE স্টেটমেন্ট ব্যবহার করা হয়।

CREATE TABLE table_name (
    column1 datatype,
    column2 datatype
);

Impala SQL কোয়েরি স্ট্রাকচার

Impala SQL কোয়েরি স্ট্রাকচার সাধারণত কয়েকটি অংশে বিভক্ত থাকে। প্রতিটি অংশ ডেটা প্রসেসিংয়ের জন্য গুরুত্বপূর্ণ ভূমিকা পালন করে।

১. SELECT Clause

SELECT ক্লজ হলো মূল অংশ যেখানে আপনি যে কলামগুলো নির্বাচন করতে চান তা উল্লেখ করেন।

SELECT column1, column2
FROM table_name;

২. FROM Clause

FROM ক্লজ ডেটা নির্বাচনের জন্য যেই টেবিল বা ডেটাসেট ব্যবহার করা হবে তা নির্ধারণ করে।

SELECT column1
FROM table_name;

৩. WHERE Clause

WHERE ক্লজ ব্যবহার করে নির্দিষ্ট শর্তে ডেটা ফিল্টার করা হয়। এটি কোয়েরি ফলাফলকে আরও সুনির্দিষ্ট এবং সীমাবদ্ধ করে।

SELECT column1
FROM table_name
WHERE condition;

৪. GROUP BY Clause

GROUP BY ক্লজ ব্যবহৃত হয় ডেটাকে গ্রুপ করতে। এটি সাধারণত স্যাম্পলিং, গড় (average), বা মোট (sum) হিসাব করার জন্য ব্যবহার হয়।

SELECT column1, COUNT(*)
FROM table_name
GROUP BY column1;

৫. ORDER BY Clause

ORDER BY ক্লজ ব্যবহার করে ডেটাকে একটি নির্দিষ্ট ক্রমে সাজানো যায় (অ্যাসেন্ডিং বা ডেসেন্ডিং অর্ডারে)।

SELECT column1
FROM table_name
ORDER BY column1 DESC;

৬. LIMIT Clause

LIMIT ক্লজের মাধ্যমে, আপনি কোয়েরি থেকে নির্দিষ্ট সংখ্যক রেকর্ড ফিরিয়ে আনতে পারেন।

SELECT column1
FROM table_name
LIMIT 10;

Impala SQL-এ যোগ্য কিছু বিশেষ ফিচার

১. JOIN অপারেশন

Impala SQL বিভিন্ন টেবিলের মধ্যে ডেটা মেলাতে JOIN অপারেশন ব্যবহার করা হয়।

SELECT a.column1, b.column2
FROM table_a a
JOIN table_b b ON a.id = b.id;

২. Aggregation Functions

Impala SQL কোয়েরিতে অ্যাগ্রিগেশন ফাংশন ব্যবহার করে একত্রিত ফলাফল পাওয়া যায়, যেমন SUM, AVG, COUNT, MAX, MIN ইত্যাদি।

SELECT SUM(column1)
FROM table_name;

৩. Subqueries

Impala SQL এ সাব-কোয়েরি (Subquery) ব্যবহার করে একটি কোয়েরির ফলাফল অন্য কোয়েরিতে ব্যবহার করা যায়।

SELECT column1
FROM table_name
WHERE column2 = (SELECT MAX(column2) FROM table_name);

সারাংশ

Impala SQL সিনট্যাক্স এবং কোয়েরি স্ট্রাকচার হাডুপ (Hadoop) পরিবেশে ডেটার উপর কার্যকরভাবে বিশ্লেষণ ও প্রক্রিয়াকরণ চালাতে সহায়তা করে। SQL এর স্ট্যান্ডার্ড সিনট্যাক্স অনুসরণ করার ফলে, এটি ব্যবহারকারীদের জন্য পরিচিত এবং সহজবোধ্য করে তোলে। Impala-র বিভিন্ন ফিচার যেমন JOIN, Aggregation Functions, এবং Subqueries ডেটা বিশ্লেষণ এবং প্রসেসিং আরও শক্তিশালী করে তোলে, যা বড় ডেটা সেটের দ্রুত বিশ্লেষণের জন্য উপযোগী।

Content added By
Promotion
NEW SATT AI এখন আপনাকে সাহায্য করতে পারে।

Are you sure to start over?

Loading...